آپاچی اسپارک با جاوا - Spark را از یک استاد بزرگ داده بیاموزید [ویدئو]

Apache Spark with Java - Learn Spark from a Big Data Guru [Video]

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: این دوره آموزشی تمام اصول Apache Spark با جاوا را پوشش می دهد و هر آنچه را که باید در مورد توسعه برنامه های Spark با جاوا بدانید را به شما آموزش می دهد. در پایان این دوره، دانش عمیق pf Apache Spark، تجزیه و تحلیل کلی داده های بزرگ و مهارت های دستکاری را به دست خواهید آورد. با این مهارت‌های جدید، می‌توانید به شرکت خود کمک کنید تا Apache Spark را برای ایجاد خط لوله پردازش داده‌های بزرگ و برنامه‌های کاربردی تجزیه و تحلیل داده تطبیق دهد. این دوره بیش از 10 نمونه داده های بزرگ را پوشش می دهد. شما دانش ارزشمندی در مورد نحوه قالب بندی مسائل تجزیه و تحلیل داده ها به عنوان مسائل Spark خواهید آموخت. با هم نمونه هایی مانند جمع آوری لاگ های وب آپاچی ناسا از منابع مختلف را یاد خواهیم گرفت. ما روند قیمت را با نگاهی به داده های املاک در کالیفرنیا بررسی خواهیم کرد. ما برنامه‌های Spark را می‌نویسیم تا از طریق داده‌های نظرسنجی Stack Overflow، میانگین دستمزد توسعه‌دهندگان در کشورهای مختلف را بفهمیم. ما سیستمی را برای تجزیه و تحلیل نحوه توزیع فضاهای سازنده در مناطق مختلف بریتانیا و موارد دیگر توسعه خواهیم داد. - مروری بر معماری آپاچی اسپارک. - با انتزاع اولیه Apache Spark، مجموعه داده های توزیع شده انعطاف پذیر (RDDs) کار کنید. پردازش و تجزیه و تحلیل مجموعه داده های بزرگ - برنامه های Apache Spark 2.0 را با استفاده از تبدیل ها و اقدامات RDD و Spark SQL توسعه دهید. - برنامه های Spark را در یک خوشه Hadoop YARN از طریق سرویس Elastic MapReduce آمازون افزایش دهید. - داده های ساختاریافته و نیمه ساختار یافته را با استفاده از Datasets و DataFrames تجزیه و تحلیل کنید و درک کاملی از Spark SQL ایجاد کنید. - اطلاعات را در میان گره های مختلف در یک خوشه اسپارک آپاچی توسط متغیرهای پخش و انباشته ها به اشتراک بگذارید. -یادگیری تکنیک های پیشرفته برای بهینه سازی و تنظیم کارهای Apache Spark با پارتیشن بندی، کش کردن و تداوم RDD ها. - بهترین شیوه های کار با آپاچی اسپارک را در این زمینه بیاموزید. هر کسی که می خواهد به طور کامل نحوه عملکرد فناوری Apache Spark را درک کند و یاد بگیرد که چگونه Apache Spark در این زمینه استفاده می شود. مهندسان نرم افزاری که می خواهند برنامه های Apache Spark 2.0 را با استفاده از Spark Core و Spark SQL توسعه دهند. دانشمندان داده یا مهندسان داده که می‌خواهند با بهبود مهارت‌های پردازش داده‌های بزرگ، شغل خود را ارتقا دهند. - دانش عمیقی از Spark، تجزیه و تحلیل کلی داده های بزرگ و مهارت های دستکاری داده ها به دست خواهید آورد. * - شما می توانید برنامه Spark را توسعه دهید که با استفاده از سرویس Elastic MapReduce آمازون، گیگابایت داده را هم بر روی لپ تاپ و هم در فضای ابری تجزیه و تحلیل می کند.

سرفصل ها و درس ها

با آپاچی اسپارک شروع کنید Get Started with Apache Spark

  • بررسی اجمالی دوره The Course Overview

  • مقدمه ای بر اسپارک Introduction to Spark

  • جاوا و گیت را نصب کنید Install Java and Git

  • پروژه Spark را با IntelliJ IDEA راه اندازی کنید Set up Spark project with IntelliJ IDEA

  • پروژه Spark را با Eclipse راه اندازی کنید Set up Spark project with Eclipse

  • اولین کار Spark ما را اجرا کنید Run our first Spark job

RDD RDD

  • مبانی RDD RDD Basics

  • RDD ها را ایجاد کنید Create RDDs

  • تبدیل نقشه و فیلتر Map and Filter Transformation

  • راه حل مسئله فرودگاه ها بر اساس عرض جغرافیایی Solution to Airports by Latitude Problem

  • تبدیل FlatMap FlatMap Transformation

  • تنظیم عملیات Set Operation

  • اقدامات Actions

  • حل مسئله جمع اعداد Solution to Sum of Numbers Problem

  • جنبه های مهم در مورد RDD Important Aspects about RDD

  • خلاصه ای از عملیات RDD Summary of RDD Operations

  • ذخیره سازی و ماندگاری Caching and Persistence

معماری اسپارک و اجزای سازنده Spark Architecture and Components

  • معماری جرقه Spark Architecture

  • اجزای جرقه Spark Components

RDD را جفت کنید Pair RDD

  • مقدمه ای بر جفت RDD Introduction to Pair RDD

  • ایجاد جفت RDD Create Pair RDDs

  • تبدیل‌های فیلتر و MapValue در جفت RDD Filter and MapValue Transformations on Pair RDD

  • کاهش با تجمع کلید Reduce By Key Aggregation

  • نمونه راه حل برای مشکل خانه متوسط Sample solution for the Average House problem

  • گروه بر اساس تبدیل کلید Group by Key Transformation

  • مرتب سازی بر اساس تبدیل کلید Sort by Key Transformation

  • نمونه راه حل برای مسئله شمارش کلمات مرتب شده Sample Solution for the Sorted Word Count Problem

  • پارتیشن بندی داده ها Data Partitioning

  • به عملیات بپیوندید Join Operations

موضوع جرقه پیشرفته Advanced Spark Topic

  • آکومولاتورها Accumulators

  • راه حل مشکل پیگیری StackOverflow Survey Solution to StackOverflow Survey Follow-up Problem

  • متغیرهای پخش Broadcast Variables

Spark SQL Spark SQL

  • مقدمه ای بر Spark SQL Introduction to Spark SQL

  • Spark SQL در عمل Spark SQL in Action

  • عمل Spark SQL: مشکل قیمت خانه Spark SQL practice: House Price Problem

  • Spark SQL Joins Spark SQL Joins

  • مجموعه داده با تایپ قوی Strongly Typed Dataset

  • از Dataset یا RDD استفاده کنید Use Dataset or RDD

  • تبدیل مجموعه داده و RDD Dataset and RDD Conversion

  • تنظیم عملکرد Spark SQL Performance Tuning of Spark SQL

در حال اجرا جرقه در یک خوشه Running Spark in a Cluster

  • مقدمه ای بر Running Spark in a Cluster Introduction to Running Spark in a Cluster

  • Package Spark Application and Use Spark-submit Package Spark Application and Use spark-submit

  • برنامه Spark را در خوشه آمازون EMR (Elastic MapReduce) اجرا کنید Run Spark Application on Amazon EMR (Elastic MapReduce) cluster

نمایش نظرات

آپاچی اسپارک با جاوا - Spark را از یک استاد بزرگ داده بیاموزید [ویدئو]
جزییات دوره
3 h 20 m
43
Packtpub Packtpub
(آخرین آپدیت)
1
5 از 5
ندارد
دارد
دارد
James Lee
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

James Lee James Lee

مهندس نرم افزار سیلیکون ولی